IM 820 SeminarDatamining

Diese Seite: inhaltliche Planung des Master-Seminars Datamining ( Stand: August 2015) Für eine Definition der Inhalte, Lernziele etc. siehe die Modulbeschreibung im Modulhandbuch Master Informatik.

Ort und Zeit:

  • Freitag, 9:30 - 12:00 Uhr ( 23.Okt, Dez, Jan; nicht im November)
  • ZH 003

NEU 2015-10-04: Beginn:

  • am Fr, 2015-10-23 um 9:30 Uhr.

Das Seminar hat keine Teilnehmerbeschränkung. Wer teilnehmen will, bitte wie folgt vorgehen:

Datamining ist ein nicht nur ein hoch aktuelles, sondern auch umfangreiches Gebiet. Im Bachlorstudiengang Informatik wird zurzeit keine Grundlagenveranstaltung angeboten, auf die das Seminar aufbauen könnte. Gottseidank gibt es z.B. mit dem Buch "Data Mining" von Witten, Frank und Hall (2011) ein hervorragendes Lehrbuch incl. Software, das wunderbar gleichermaßen als Einführung und Vertiefung dienen kann:

Seminarinhalt

Wir werden uns in den ersten 4 Wochen des Semesters die Grundlagen von Datamining durch ein diszipliniertes Selbst-Literaturstudium aneignen.

  • Grundlagenstoff im Weka-Buch, von jedem zu erarbeiten:
    • Chapter 1-3 (pp. 1-83): gründlich und z.T. auch im Detail verstehen
    • Chapter 4, für jeden Abschnitt 4.1 bis 4.10 jeweils die Grundidee des Modells aus den einleitenden Absätzen verstehen (aber keine Details)
    • Chapter 5 (pp. 147-187): Grundideen verstehen
    • Part 3 (Software): Weka downloaden, damit spielen; nach Bedarf in die Präsentationen einbinden
  • nach belieben ergäntz duch die Weka-Videos: http://www.cs.waikato.ac.nz/ml/weka/mooc/dataminingwithweka/

In diesen 4 Wochen werden wir eine Wissensgrundlage geschaffen haben, von der aus wir in den folgenden Präsentationen arbeitsteilig in die Tiefe gehen können:

Chapter 6: Implementations: Real machine learning schemes

  • 6.1 Decision Trees
  • 6.2 Classification Rules
  • 6.3 Association Rules
  • 6.4 Extending Linear Models
  • 6.5 Instance-Based Learning
  • 6.6 Numeric Prediction with Local Linear Models
  • 6.7 Bayesian Networks
  • 6.8 Clustering
  • 6.9 Semisupervised Learning
  • 6.10 Multi-Instance Learning

Chapter 7: Data Transformations

  • 7.1 Attribute Selection
  • 7.2 Discretizing Numeric Attributes
  • 7.3 Projections
  • 7.4 Sampling
  • 7.5 Cleansing
  • 7.6 Transforming Multiple Classes to Binary Ones

Chapter 9: Moving on: Applications and Beyond, z.B.

  • 9.2 Learning from Massive Datasets
  • 9.3 Data Stream Learning
  • 9.4 Incorporating Domain Knowledge
  • 9.5 Text Mining
  • 9.6 Web Mining
  • im Web: Mining Big Data using Weka 3

Bitte beachten Sie: Auch wenn wir Chapter 6 und 7 arbeitsteilig behandeln geht das nicht ohne ein gründliches Verständnis der (und nicht ohne Rückbezüge auf die) o.A. Grundlagen. Sich lediglich auf ein Detail zu konzentrieren, ohne es in das große Ganze einzuordnen führt nicht zu einer guten Präsentation.

Aus dem gleichen Grund werden wir - unabhängig von der tatsächlichen Anzahl von Seminarteilnehmern - alle Vertiefungsthemen vernetzt behandeln; jeder Teilnehmer sollte also in seiner Präsentation je einen Aspekt aus Chapter 6, Chapter 7 und Chapter 9 zur Sprache bringen.

Bewertungsgrundlagen

Laut Modulhandbuch ist eine Präsentation vorgesehen. Ich bewerte eine Präsentation auf Grundlage der Inhalte (statt z.B. der Rhetorik); die Inhalte wiederum setze ich vorwiegendst als medial-schriftlich (statt rhein mündlich) codiert voraus. Bewertungsgrundlage sind also insbesondere Präsentationsmedien wie z.B. Slides und Teilnehmer-Handout.

Text-Typ für die Präsentation:

  • informatives, didaktisiertes Lang-Referat mit Visualisierungen (slides, Poster etc.); Priorität hat eine fundierte Sachdarstellung;
  • eine diskursive Auseinadersetzung mit einer konkreten, auf einen konkreten Fall bezogenen Fragestellung, wie ich es in anderen Seminaren einfordere, ist in dieser Veranstaltung zwar möglich, aber nicht zwingend erforderlich: zuerst müssen wir uns um die Grundlagen kümmern!

Ergebnisse der Vorbesprechung 2015-10-23

Teilnehmer und Themen: siehe https://moodle.haw-landshut.de/mod/resource/view.php?id=13014

Vorträge

  • Fr. 11.12.2015: Themen 6.1 - 6.5
  • Fr 18.12.2015: Themen 6.6 - 6.10
  • Zeit: jeweils 8:00 - 16:00 Uhr
  • Raum: N.N.
  • Vortragsdauer: 30 Minuten, plus 15 Minuten Diskussion

Die Vorträge selbst werden nicht bewertet, sondern erzeugen ein Feedback, das idealerweise zur Verbesserung und Finalisierung der schriftlichen Präsentationsunterlagen führt.

Abgabe Präsentation: bis Mi (Aschermittwoch), 10.2.2016 23:55 Uhr https://moodle.haw-landshut.de/mod/assign/view.php?id=13015